翻译质量估计(QE)是预测机器翻译(MT)输出质量的任务,而无需任何参考。作为MT实际应用中的重要组成部分,这项任务已越来越受到关注。在本文中,我们首先提出了XLMRScore,这是一种基于使用XLM-Roberta(XLMR)模型计算的BertScore的简单无监督的QE方法,同时讨论了使用此方法发生的问题。接下来,我们建议两种减轻问题的方法:用未知令牌和预训练模型的跨语性对准替换未翻译的单词,以表示彼此之间的一致性单词。我们在WMT21 QE共享任务的四个低资源语言对上评估了所提出的方法,以及本文介绍的新的英语FARSI测试数据集。实验表明,我们的方法可以在两个零射击方案的监督基线中获得可比的结果,即皮尔森相关性的差异少于0.01,同时在所有低资源语言对中的平均低资源语言对中的无人看管竞争对手的平均水平超过8%的平均水平超过8%。 。
translated by 谷歌翻译
社区问题应答(CQA)论坛为许多现实生活质疑提供答案。由于大小,这些论坛在机器学习研究人员中非常受欢迎。自动答案选择,答案排名,问题检索,专家查找,事实检查是使用CQA数据执行的示例学习任务。在本文中,我们展示了CQA的第一个波斯数据集PercQA。此数据集包含从最着名的波斯论坛爬行的问题和答案。在数据采集之后,我们在迭代过程中提供严格的注释指南,然后在SemevalcQA格式中注释问题答案对。PercQ包含989个问题和21,915个答案答案。我们将Percqa公开可供使波斯CQA更多的研究。我们还通过使用单语和多语言预先训练的语言模型来构建PercQA中答案选择任务的强大基准
translated by 谷歌翻译